查看原文
其他

在线人类孟德尔遗传(OMIM)数据库简介

叶明皓,宋红卫 聊生信 2022-05-14

OMIM,即在线人类孟德尔遗传(Online Mendelian Inheritance in Man),是一个综合的、权威的研究人类表型和基因型关系的数据库,收录了所有已知的孟德尔疾病,和超过16000个基因的信息(涵盖一大半人类已知的基因)。

OMIM并不是创造了这些数据,而是对已发表的研究结果的非常系统的整理与整合,并每日更新、免费获取。OMIM中的一个常见的疾病的页面,其内容类似一篇综述,包含:表型与基因的关系、临床简介、疾病基本信息与描述、临床特征、诊断、临床管理、发病机制、分子遗传、群体遗传、动物模型、背景历史、研究进展和参考文献

网站条目(entries)也包含了大量其他遗传资源(数据库)的链接,可与遗传疾病有关的医生、专业人员、遗传学研究人员、相关学科和医学的高年级学生使用。

OMIM的发展史还是比较悠久的。最早由维克多·A·麦考斯克(Victor A. McKusick)博士在20世纪60年代早期创建,作为孟德尔性状和疾病(mendelian traits and disorders)的目录,命名为人类孟德尔遗传(Mendelian Inheritance in Man,MIM)。
在1966年到1998年间,MIM出版了12个版本。在线版的OMIM是1985年由美国国家医学图书馆(National Library of Medicine)和约翰·霍普金斯大学(Johns Hopkins)威廉·H·韦尔奇医学图书馆(William H. Welch Medical Library)合作创建的。从1987年开始在互联网上广泛使用。1995年,美国国家生物技术信息中心(NCBI)参与了OMIM的万维网开发。

麦考斯克博士是绘制人类基因组图谱的早期倡导者,并密切参与了人类基因组计划的早期,并担任了人类基因组组织(HUGO)的创始主席。1997年,为了表彰他一生的贡献,他获得了拉斯克医学科学特殊成就奖。

https://omim.org/about


以镰刀型贫血症为例介绍OMIM的使用

以一个比较熟知的镰刀型贫血症(Sickle Cell Anemia,SCA)为例。之前一篇推文介绍过SCA的致病机制、突变蛋白三维结构,见:正常与突变蛋白三维结构模型的绘制与分析

SCA的致病基因为HBB(Hemoglobin Subunit Beta,血红蛋白β亚基)基因,第6位氨基酸Glu转位为Val(Glu6Val)。野生与突变蛋白三维结构模型如下(详见推文):

  

表面电荷:左侧野生,右侧突变

野生来自AlphaFold,突变来自PyMOL的手动突变。

  

表面电荷:左侧野生,右侧突变

野生和突变模型均使用SWISS-MODEL从头预测。

致病机制图解:

OMIM疾病页面的头部信息

进入OMIM主页(https://omim.org/)。在OMIM的检索框中输入:Sickle Cell Anemia


OMIM的检索框中可输入:临床特征、表型、基因等关键字进行检索。

若要下载重要的后台数据,以便批量分析,需要注册学校或研究单位的正式邮箱(而非商业邮箱)。


检索结果如下图:

进入第一个检索结果,页面如下图:

红框:目录。点击之后在页面内快速跳转。包括:表型与基因的关系、临床简介、疾病基本信息与描述、临床特征、诊断、临床管理、发病机制、分子遗传、群体遗传、动物模型、背景历史、研究进展和参考文献。

绿框:是外部链接。Protein给出了SCA致病基因HBB蛋白的UniProt链接。另有其它临床资源数据库、动物模型、细胞系链接。

蓝框:疾病和基因关系简述。SCA的MIM编号'# 603903'中的#号表示描述性条目,通常指表型。


井号(#)表示描述性条目,通常是表型的;星号(*)表示一个基因;加号(+)表示该条目包含已知序列和表型的基因描述;百分号(%)表示该条目描述了一个确定的孟德尔表型或未知分子基础的表型位点;插入符号(^)表示该条目不再存在。


黄框:表示表型与基因的关系。

 1-7分别表示: 
  1. 染色体高分辨率显带及命名体系。'11p15.4'表示11号染色体短臂1区5带第4亚带。
  2. 表型(Phenotype),或叫显型,可指某种疾病。

表型:有特定基因型的个体,在一定环境条件下,生物体所表现出来的一组可观察到的特征(characteristics)或性状(traits)的总和。性状(traits)指生物形态、结构和生理、生化等特性。

  3. 表型的MIM编号。是OMIM的一种编号系统(或条目,entry),6位数字。编号原则如下:

镰刀型贫血症的Phenotype MIM number为 '# 603903',说明是1994年之后被OMIM收录并编号的常染色体疾病。

 4. 经典孟德尔遗传模式。包括:常染色体隐性遗传,Autosomal Recessive (AR);常染色体显性遗传,Autosomal Dominant (AD);X连锁隐性遗传,X-linked recessive (XR);X连锁显性遗传,X-linked dominant (XD);Y连锁遗传,Y-linked inheritance。

  5. 表型映射关键词。可将鼠标移动到数字上以显示相关信息。


相关数字的含义:1表示该疾病是通过野生型基因定位的;2表示疾病表型本身被定位;3表示疾病的分子基础是已知的;4表示该疾病是一种染色体缺失或复制综合征。

  6. 相关的基因或染色体位点或位置。

  7. 基因的MIM编码。OMIM的MIM编码不仅针对表型,也涵盖基因,以及该基因的等位基因变异(SNV/SNP)


一个疾病的、一个致病基因的多个不同的SNV/SNP(单核苷酸变异/等位基因变异),用MIM编号的后面跟着的一个小数点和一个唯一的4位数字来表示。

例如,Factor IX基因(即F9基因,血友病的一个致病基因)的MIM编号为300746,它的多个等位变异编号为300746.0001到300746.0101,可分别对应不同的SNV。


下图是HBB基因等位基因变异(SNV)的MIM编号(https://omim.org/entry/141900):

点击目录中的Table View

疾病与基因详情页的其它信息

疾病的详情页。主要是对该疾病已有研究结果、临床经验的详细汇总,具体包括:临床特征、诊断、临床管理、发病机制、分子遗传、群体遗传、动物模型、背景历史、研究进展和参考文献。
基因的详情页,如HBB(MIM编号:* 141900。https://omim.org/entry/141900),展示方式与疾病详情页不同,主要包括:所有与该基因有关的疾病(见下图)基因结构、基因组映射(Mapping)、基因功能、生化特性、分子遗传学、动物模型、背景历史、等位基因变异(这部分的具体内容见上文)。

可见HBB不仅仅与SCA有关(AR),也与地中海贫血等疾病相关(AD),且同一个基因在不同疾病的中的遗传模式可能不同。

OMIM后台数据的下载。在Download页面‍提供一些文件的下载链接。一般需要写邮件申请,但某些商业邮箱如网易或qq邮箱可能无法申请。此外,数据不完全免费,有些数据对方可能会提出报价。
OMIM全部后台数据的获取,可能有助于外显子数据分析中对候选基因的筛选。但这些基因一般是已知的、与该疾病有较强关联的基因,由于个体的异质性,特定疾病中OMIM收录的基因可能不全。
撰写:宋红卫

校对:叶明皓

更多人类遗传学知识、文献和分析技术
请关注和星标聊生信

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存